



### IN THE UNITED STATES PATENT AND TRADEMARK OFFICE

Applicant:

Fumitoshi MIZUTANI, et al.

Title:

DATA PROCESSING APPARATUS AND DATA PROCESSING

**METHOD** 

Appl. No.:

10/827,433

Filing Date: 04/20/2004

Examiner:

Unknown

Art Unit:

Unknown

# **CLAIM FOR CONVENTION PRIORITY**

Commissioner for Patents P.O. Box 1450 Alexandria, VA 22313-1450

Sir:

The benefit of the filing date of the following prior foreign application filed in the following foreign country is hereby requested, and the right of priority provided in 35 U.S.C. § 119 is hereby claimed.

In support of this claim, filed herewith is a certified copy of said original foreign application:

> Japanese Patent Application No. 2003-115621 filed 04/21/2003.

> > Respectfully submitted,

Date: May 26, 2004

**FOLEY & LARDNER LLP** Customer Number: 22428

Telephone:

(202) 672-5407

Facsimile:

(202) 672-5399

David A. Blumenthal Attorney for Applicant Registration No. 26,257

# 日本国特許庁 JAPAN PATENT OFFICE

別紙添付の書類に記載されている事項は下記の出願書類に記載されている事項と同一であることを証明する。

This is to certify that the annexed is a true copy of the following application as filed with this Office.

出 願 年 月 日
Date of Application:

2003年 4月21日

出 願 番 号 Application Number:

特願2003-115621

[ST. 10/C]:

[JP2003-115621]

出 願 人
Applicant(s):

日本電気株式会社

2004年 3月 2日

特許庁長官 Commissioner, Japan Patent Office 今井康



【書類名】

特許願

【整理番号】

62703096

【提出日】

平成15年 4月21日

【あて先】

特許庁長官 殿

【国際特許分類】

G06F 15/16

G06F 11/16

【発明者】

【住所又は居所】

東京都港区芝五丁目7番1号 日本電気株式会社内

【氏名】

水谷 文俊

【発明者】

【住所又は居所】

東京都港区芝五丁目7番1号 日本電気株式会社内

【氏名】

尾田 眞也

【特許出願人】

【識別番号】

000004237

【氏名又は名称】 日本電気株式会社

【代理人】

【識別番号】

100095407

【弁理士】

【氏名又は名称】

木村 満

【手数料の表示】

【予納台帳番号】

038380

【納付金額】

21,000円

【提出物件の目録】

【物件名】

明細書 1

【物件名】

図面 1

【物件名】

要約書 1

【包括委任状番号】 9715824

【プルーフの要否】

要

# 【書類名】 明細書

【発明の名称】 データ処理装置

#### 【特許請求の範囲】

### 【請求項1】

同一のデータ送信元から同一のデータを受信する複数の受信インタフェース部を備え、前記複数の受信インタフェース部が受信したデータの処理を並列して行うデータ処理装置において、

前記各受信インタフェース部は、受信したデータにエラーが発生すると、データの受信を停止し、異なる受信インタフェース部に、前記データ送信元からのデータ受信を停止させる通信エラー信号を出力して、前記データ送信元にデータの再送を要求する通信エラー処理部を備えた、

ことを特徴とするデータ処理装置。

### 【請求項2】

前記各受信インタフェース部の通信エラー処理部は、受信したデータの一部に エラーが発生すると、エラーが発生したデータを破棄して、前記データ送信元に 、破棄したデータの再送を要求するように構成されたものである、

ことを特徴とする請求項1に記載のデータ処理装置。

#### 【請求項3】

前記データ送信元は、同一のシリアルデータを送信するものであって、

前記各受信インタフェース部の通信エラー処理部は、受信したシリアルデータ にエラーが発生すると、エラーが発生したシリアルデータ及び当該データに続い て受信したシリアルデータを破棄して、前記データ送信元に破棄したシリアルデ ータの再送を要求するように構成された、

ことを特徴とする請求項1に記載のデータ処理装置。

#### 【請求項4】

前記データ送信元は、各パケットにシーケンス番号を付加してパケット単位で 前記データを送信するものであって、

前記各受信インタフェース部の通信エラー処理部は、受信したパケットのデータにエラーが発生すると、前記受信した各パケットに付加されたシーケンス番号

に基づいてパケット単位で、前記データ送信元に、データの再送を要求するよう に構成されたものである、

ことを特徴とする請求項1乃至3のいずれか1項に記載のデータ処理装置。

# 【請求項5】

所定のクロック信号の周波数を分周して同期信号を生成し、生成した同期信号 を前記各受信インタフェース部に供給する分周器を備え、

前記各受信インタフェース部は、前記分周器が供給した同期信号に従ってデータを受信するものである、

ことを特徴とする請求項1乃至4のいずれか1項に記載のデータ処理装置。

### 【請求項6】

送信対象のデータを同じタイミングで複数のデータ送信先に送信する送信イン タフェース部を備えたデータ処理装置において、

前記送信インタフェース部は、送信対象のデータを、所定のクロック信号の1 周期以内で送信可能なデータ長のデータに分割してパケットデータを生成し、生成した各パケットデータを前記クロック信号に同期させて同じタイミングで前記 複数の送信先に送信するように構成された、

ことを特徴とするデータ処理装置。

#### 【発明の詳細な説明】

 $[0\ 0\ 0\ 1]$ 

【発明の属する技術分野】

本発明は、同一のデータを並列して処理するデータ処理装置に関する。

[0002]

#### 【従来の技術】

データ処理を実行するコンピュータシステムとして、既存のコンポーネントを 流用して、冗長化された構成のフォールトトレラントコンピュータシステムがあ る(例えば、特許文献 1 参照)。このコンピュータシステムでは、ロックステッ プ方式が採用されている。

[0003]

このロックステップ方式とは、冗長化構成の複数のプロセッサを備え、複数の

プロセッサが同一のデータを同期して並列処理し、複数のプロセッサからの出力 を比較してエラーを検出すると、そのエラーを修復するようにした方式である。

### [0004]

また、近年のコンピュータシステムにおいては、プロセッサと  $I \angle O$ システムとの間の接続には、PCI-Express、Hyper-Transport(登録商標)、InfiniBand(登録商標)等のような高速でデータの送受信を行える高速シリアルリンク方式が採用されつつある。

### [0005]

### 【特許文献1】

特開平9-128349号公報(第5-7頁、図1)

### [0006]

### 【発明が解決しようとする課題】

しかし、従来の冗長構成のコンピュータシステムにおいて、このような高速の データ送受信方式を採用することにより、データの送受信速度が速くなると、複数のプロセッサが処理するデータの同一性を保証することが難しくなり、通信エラーも生じやすくなる。

#### [0007]

プロセッサと I / Oシステムとの間でデータを送受信するインタフェース部は、通信エラーを検出すると、それぞれ、異なるタイミングでデータの再送信を要求してしまう。各インタフェース部が、データの再送信を要求すると、各プロセッサでの処理のタイミングや順序にずれが生じ、ロックステップ方式を維持できなくなり、複数のプロセッサが同一のデータ処理を同期して行うことが難しくなる。

# [0008]

また、このようなコンピュータシステムにおいては、通信線の配線長によって データ遅延が生じやすい。データ遅延が生じて複数のプロセッサの処理タイミン グがずれると、同じように複数のプロセッサが同一のデータ処理を同期して行う ことが難しくなる。このため、等長配線を厳密に行わなければならず、システム の筐体構造やボード設計、ボード構成の自由度にも大きな制約が生じることにな る。

# [0009]

本発明は、このような従来の問題点に鑑みてなされたもので、通信エラーが生じた場合でも同一のデータ処理を同期して行うことが可能なデータ処理装置を提供することを目的とする。

### [0010]

# 【課題を解決するための手段】

この目的を達成するため、本発明の第1の観点に係るデータ処理装置は、

同一のデータ送信元から同一のデータを受信する複数の受信インタフェース部を備え、前記複数の受信インタフェース部が受信したデータの処理を並列して行うデータ処理装置において、

前記各受信インタフェース部は、受信したデータにエラーが発生すると、データの受信を停止し、異なる受信インタフェース部に、前記データ送信元からのデータ受信を停止させる通信エラー信号を出力して、前記データ送信元にデータの再送を要求する通信エラー処理部を備えたものである。

# [0011]

このような構成によれば、通信エラーが生じた場合でも同一のデータ処理を同期して行うことが可能になる。

#### [0012]

前記各受信インタフェース部の通信エラー処理部は、受信したデータの一部に エラーが発生すると、エラーが発生したデータを破棄して、前記データ送信元に 、破棄したデータの再送を要求するように構成されたものであってもよい。

#### $[0\ 0\ 1\ 3]$

前記データ送信元は、同一のシリアルデータを送信するものであって、

前記各受信インタフェース部の通信エラー処理部は、受信したシリアルデータ にエラーが発生すると、エラーが発生したシリアルデータ及び当該データに続い て受信したシリアルデータを破棄して、前記データ送信元に破棄したシリアルデ ータの再送を要求するように構成されたものであってもよい。

#### [0014]

前記データ送信元は、各パケットにシーケンス番号を付加してパケット単位で 前記データを送信するものであって、

前記各受信インタフェース部の通信エラー処理部は、受信したパケットのデータにエラーが発生すると、前記受信した各パケットに付加されたシーケンス番号に基づいてパケット単位で、前記データ送信元に、データの再送を要求するように構成されたものであってもよい。

### [0015]

所定のクロック信号の周波数を分周して同期信号を生成し、生成した同期信号 を前記各受信インタフェース部に供給する分周器を備え、

前記各受信インタフェース部は、前記分周器が供給した同期信号に従ってデータを受信するものであってもよい。 '

# [0016]

本発明の第2の観点に係るデータ処理装置は、

送信対象のデータを同じタイミングで複数のデータ送信先に送信する送信インタフェース部を備えたデータ処理装置において、

前記送信インタフェース部は、送信対象のデータを、所定のクロック信号の1 周期以内で送信可能なデータ長のデータに分割してパケットデータを生成し、生成した各パケットデータを前記クロック信号に同期させて同じタイミングで前記 複数の送信先に送信するように構成されたものである。

### [0017]

### 【発明の実施の形態】

以下、本発明の実施の形態に係るデータ処理装置を図面を参照して説明する。 尚、本実施の形態に係るデータ処理装置を、冗長構成を有するコンピュータシ ステムとして説明する。

本実施の形態に係るコンピュータシステムの構成を図1に示す。

本実施の形態に係るコンピュータシステムは、冗長化構成の複数のプロセッサを備え、複数のプロセッサが同一のデータを同期して並列処理するロックステップ方式に従って動作するフォールトトレラントコンピュータシステムであり、サブシステム1、2を備えて構成される。

### [0018]

サブシステム1は、演算システム11と、I/Oシステム12と、を備えて構成される。サブシステム2は、演算システム21と、I/Oシステム22と、を備えて構成される。

### [0019]

演算システム11,21には、同期した周波数166MHzのクロック信号CLKが供給される。このように、演算システム11,21に、同期したクロック信号CLKが供給されることにより、サブシステム1,2は、ロックステップ方式に従って、同一の処理を同期して同時に実行する。

### [0020]

サブシステム1,2の間には、分周器31が接続される。分周器31は、FSBのクロック信号CLKが供給されて、このクロック信号CLKを分周するものであり、クロック信号CLKを分周して同期信号S1を生成する。

# [0021]

分周器31は、生成した同期信号S1を演算システム11のメモリブリッジ16、演算システム21のメモリブリッジ26、I/Oシステム12のI/Oブリッジ18、I/Oシステム22のI/Oブリッジ28に、それぞれ、供給する。

## [0022]

尚、本実施の形態では、データの送受信に、PCI-Expressインタフェースを用いるものとする。PCI-Expressインタフェースでは、パラレルバスで生ずる信号線と信号線との間でのデータのずれ(スキュー)を防止するため、シリアルリンクが採用されている。演算システム11,21とI/Oシステム12,22との間もPCI-Expressインタフェースに従って接続される。

### [0023]

分周器 3 1 は、同期信号 S 1 の 1 周期が、2.5 Gbps/laneのPCI-Express インタフェースの 2 4 シンボルタイムに相当するように、クロック信号 C L K の周波数 1 6 6 MH z を 1 / 1 6 の周波数 1 0 . 4 MH z に分周する。

### [0024]

PCI-Expressインタフェースでは、演算システム11, 21、I/Oシステム

12, 22といったデバイスは、1対1で接続される。差動信号を用いてデータ を伝送する場合、リンクには、片方向に2本、双方向で合計4本の信号線が用い られる。この4本の信号線の組は、レーンと呼ばれるものである。

### [0025]

### [0026]

同期信号S1の周波数が10.4MHzになることにより、I/Oブリッジ18,28、メモリブリッジ16,26は、互いに、同期信号S1の1周期で、1レーンあたり24バイトの有効データを送信することができる。

### [0027]

演算システム11は、プロセッサ13、14と、主記憶装置15と、メモリブリッジ16と、を備えて構成される。また、演算システム21は、プロセッサ23、24と、主記憶装置25と、メモリブリッジ26と、を備えて構成される。

#### $[0\ 0\ 2\ 8]$

プロセッサ13,14,23,24は、演算処理を実行するものである。主記憶装置15,25は、データ等を記憶するものである。メモリブリッジ16とプロセッサ13,14、メモリブリッジ26とプロセッサ23,24とは、それぞれ、フロントサイドバス(FSB)を介して接続され、クロック信号CLKに同期して動作する。

# [0029]

メモリブリッジ16,26は、I/Oブリッジ18,28とデータの送受信を行うものである。また、メモリブリッジ16,26は、通信エラー信号S2を相互に送受信する。この通信エラー信号S2は、メモリブリッジ16,26との間で、通信エラーの情報を共有して、連携してエラー処理を行うための信号であり、オープン・ドレイン信号として送受信される。尚、メモリブリッジ16,26の詳細な構成については、後述する。

#### [0030]

I/Oシステム 1 2 は、I/Oデバイス 1 7 と、I/Oブリッジ 1 8 と、コンフィギュレーションレジスタ 1 9 と、を備えて構成される。I/Oシステム 2 2 は、I/Oデバイス 2 7 と、I/Oブリッジ 2 8 と、コンフィギュレーションレジスタ 2 9 と、を備えて構成される。

### [0031]

I/Oデバイス17, 27は、それぞれ、I/Oブリッジ18, 28との間で データの送受信を行うものである。

### [0032]

I/Oブリッジ18、28は、それぞれ、I/Oデバイス17, 27との間、 又はメモリブリッジ16, 26との間で、シリアル伝送を行うものである。

I/Oブリッジ18、28とメモリブリッジ16, 26とは、PCI-Expressインタフェースのx8のリンクL1によって接続される。

# [0033]

即ち、演算システム11,21のそれぞれのメモリブリッジ16,26と、I /Oシステム12,22のそれぞれのI/Oブリッジ18,28とは、リンクL 1を介してクロスリンク接続されている。即ち、メモリブリッジ16は、I/O システム12,22に接続され、演算システム21のメモリブリッジ26は、I /Oシステム12,22に接続されている。

#### [0034]

このようにクロスリンク接続されることにより、演算システム11, 21は、それぞれ、I/Oシステム12, 22に対して通信可能であり、I/Oシステム12, 22は、それぞれ、演算システム11, 21に対しても通信可能になる。

#### [0035]

尚、PCI-Expressインタフェースでは、層単位のアップグレードを可能とするため、機能が階層化されている。そして、プロトコルが各階層毎に定義されている。

### [0036]

PCI-Expressインタフェースでは、図2 (a) に示すように、トランザクション層において、データにヘッダが付与されてトランザクション層パケットが生成

される。

# [0037]

また、図2(b)に示すように、データリンク層において、トランザクション層パケットにシーケンス番号とCRC(Cyclic Redundancy Check)とのステータス情報が付加されてデータリンク層パケット(DLLP: Data Link Layer Packet)が生成される。

# $[0\ 0\ 3\ 8]$

そして、図2(c)に示すように、物理層において、データリンク層パケットにフレームデータが付加される。そして、このパケットが送受信される。

### [0039]

I/Oブリッジ18、28は、このようなPCI-Expressインタフェースに従ってデータを送受信するためのインタフェース回路部(図示せず)を備える。

### [0040]

コンフィギュレーションレジスタ19,29は、分周器31から供給された同期信号S1の1周期中において、I/Oブリッジ18,28が送信するアップストリームのパケットのパケット長、データ数を制限するためのデータを保持するものである。

#### $[0\ 0\ 4\ 1]$

このようにパケット長、データ数に制限を設けたのは、送信されるパケットが、送信経路長、クロックのドリフトの影響を受けないようにするためである。具体的には、送信する各パケットの最大パケット長は、192バイトとされる。

#### $[0\ 0\ 4\ 2\ ]$

I/Oブリッジ18、28は、この制限に従い、同期信号S1の立ち上がりタイミングで、それぞれ、メモリブリッジ16、26に、同一のパケットを同時に送信する。

#### [0043]

I/Oブリッジ18,28は、複数の小さなパケットを送信する場合、同期信号S1の1周期において送信可能な最大データ数を越えないように、送信制御を行い、1つのパケットが、周波数10.4MHzの同期信号S1の1周期を越え

ないようにする。

### [0044]

尚、このコンフィギュレーションレジスタ19の値をBIOS(Basic Input/Output System)を用いて変更することができる。サブシステム1は、このようなBIOSを記憶する不揮発性メモリ(図示せず)を備える。

### [0045]

このように構成されたコンピュータシステムは、システム間の通信内容の比較により障害診断を行う。また、このコンピュータシステムは、特定のシステムでの故障が判断されると該当するシステムをマスクして、残りのシステムによって実行中の処理を継続する。

### [0046]

次に、メモリブリッジ16,26の構成について説明する。尚、メモリブリッジ26はメモリブリッジ16と同様に構成されたものであり、ここでは、メモリブリッジ16の構成についてのみ説明する。

### [0047]

メモリブリッジ16は、図3に示すように、インタフェース回路部40と、同期化用バッファ50と、内部回路部60と、からなる。

#### [0048]

インタフェース回路部 40 は、PCI-Expressインタフェースに対応して設けられたものであり、データリンク/物理層 41 と、トランザクション層 42 と、に区分される。

#### [0049]

また、データリンク/物理層 4 1 は、物理層 4 3 - 1 ~ 4 3 - n と、データリンク層 (RX) 4 4 と、データリンク層 (TX) 4 5 と、に区分され、トランザクション層 4 2 は、通信エラー処理部 4 6 と、トランザクション層 4 7 と、に区分される。

#### [0050]

このデータリンク/物理層41、トランザクション層42、内部回路部60は、互いに異なるクロック信号に同期して動作する。

### [0051]

物理層 4 3 - 1 ~ 4 3 - n は、同期信号 S 2 の 1 周期中において、図 2 (c) に示すようなパケットを送受信するための層である。インタフェース回路部 4 0 は、送受信するパケットを保持するためのエラスティックバッファ(EB)を備える。尚、インタフェース回路部 4 0 は、物理層 4 3 - 1 ~ 4 3 - n において、通信エラーを検出するとエラー情報を出力する。

### [0052]

データリンク層 (RX) 44は、図2(c)に示すパケットからデータリンク層パケットを取り出すための層である。

### [0053]

データリンク層(TX) 45 は、通信エラー処理部 46 が出力したACK/NACK/f low制御信号を受け取るための層である。

### [0054]

通信エラー処理部46は、通信エラーの処理を行うものである。

従来のPCI-Expressでは、データリンク層(RX) 4.4 が、ステータス情報の うち、いくつかのエラー信号を、トランザクション層 4.7 に、また、ACK/NACK/f low制御信号をデータリンク層(TX) 4.5 に直接供給する。

### [0055]

しかし、本実施の形態では、通信エラー処理部46が備えられ、通信エラー処理部46がこれらのステータス情報を、データリンク層(RX)44において取得する。そして、通信エラー処理部46が取得したステータス情報をトランザクション層47、データリンク層(TX)45に供給するように構成されている。

#### [0056]

通信エラー処理部46は、データリンク層パケットに付加されたCRCをチェックして、通信エラーを検出し、エラー情報を出力する。

#### [0057]

通信エラー処理部 4.6 は、物理層 4.3-1-4.3-n またはデータリンク層(RX) 4.4 において、通信エラーが検出されなければ、トランザクション層 4.7 とデータリンク層(TX) 4.5 とに、データ、ステータス情報をそのまま出力す

る。インタフェース回路部 40 は、受信したデータに通信エラーがなければ、ステータス情報に従って、データを送信した I/O ブリッジ 18 , 28 に定期的に A C K 信号を返送する。

### [0058]

一方、通信エラー処理部46は、物理層43-1~43-nまたはデータリンク層(RX)44において、通信エラーが検出されると、同期信号S1の1周期の間に受信した全パケットをロストパケットとしてキャンセルし、受信データのトランザクション層47への出力を停止する。

### [0059]

通信エラー処理部46は、パケットをキャンセルすると、データリンク層(RX)44に対して、次に受信する予定のパケットのシーケンス番号を、通信エラーパケット受信前のシーケンス番号に設定するように指示する。

### [0060]

また、通信エラー処理部46は、通信エラーを検出すると、同期信号S1の1 周期の間、通信エラー信号S2をアサート(assert)、即ち、有効とする。通信 エラー処理部46は、アサートした通信エラー信号S2を、信号線を介してメモ リブリッジ26に送信する。

### $[0\ 0\ 6\ 1]$

トランザクション層 4 7 は、上位のソフトウェア層からの読み出しと書き込み 要求を受け付けるとともにデータリンク層(RX) 4 4、データリンク層(TX) 4 5 に対してパケットの転送を要求するための層である。

#### [0062]

同期化用バッファ 5 0 は、トランザクション層 4 7 と内部回路部 6 0 との間で、データの受け渡しをするためのバッファであり、トランザクション層 4 7 から出力されたデータを保持する。

#### [0063]

内部回路部60は、同期化用バッファ50が保持しているデータを同期信号S1に同期したタイミングで取得し、取得したデータをプロセッサ13,14、主記憶装置15に送出するための回路である。

### [0064]

尚、I/Oブリッジ18, 28がメモリブリッジ16, 26にシリアルデータを送信する場合、I/Oブリッジ18, 28が送信インタフェースとなり、メモリブリッジ16, 26のインタフェース回路部が受信インタフェース部となる。

### [0065]

また、前述のようにメモリブリッジ16, 26がI/Oブリッジ18, 28にシリアルデータを送信することも可能であり、この場合、メモリブリッジ16, 26が送信インタフェースとなり、I/Oブリッジ18, 28のインタフェース回路部が受信インタフェース部となる。

### [0066]

次に本実施の形態に係るコンピュータシステムの動作を説明する。

尚、ここでは、I/Oブリッジ18が、メモリブリッジ16,26にシリアルデータを送信する場合について説明する。

### [0067]

I/Oブリッジ18は、I/Oデバイス17からデータが供給されると、I/Oブリッジ18は、図2(a)に示すように、トランザクション層において、シリアルデータにヘッダを付与し、トランザクション層パケットを生成する。

# [0068]

I/Oブリッジ18は、図2(b)に示すように、データリンク層において、 生成したトランザクション層パケットに、シーケンス番号とCRCとのステータ ス情報を付加し、データリンク層パケットを生成する。

#### [0069]

そして、I/Oブリッジ18は、図2(c)に示すように、物理層において、 生成したデータリンク層パケットに、フレームデータを付加する。そして、I/ Oブリッジ18は、図2(c)に示すパケットを、リンクL1を介してメモリブ リッジ16,26に送信する。

### [0070]

メモリブリッジ16のインタフェース回路部40は、物理層43-1~43nにおいて、このデータを受信する。 インタフェース回路部40は、図4(a)に示すように、物理層43-1~4 3- n において、同期信号S1の1周期中において受信した全パケットを、エラスティックバッファに、一旦、格納してから、データリンク層(RX)44に出力する。

### [0071]

インタフェース回路部40は、データリンク層(RX)44において、図2(c)に示すパケットからデータリンク層パケットを取り出す。また、インタフェース回路部40は、図2(b)に示すデータリンク層パケットに含まれているCRCに基づいてエラーの検出を行う。

### [0072]

通信エラー処理部46は、図4(c)に示すように、同期信号S1の各周期中において受信したパケットを、それぞれ、次の同期信号S1の立ち上がりに同期して、取得する。

### [0073]

受信したパケットにエラーが検出されなければ、通信エラー処理部46は、図4(d)に示すように、通信エラー信号S2をハイ(H)レベルにしてディアサート、即ち、無効とする。従って、受信されたパケットは有効となる。

# [0074]

そして、通信エラー処理部46は、図4(e)に示すように、各パケットを、 次の同期信号S1の立ち上がりに同期してトランザクション層に送出する。

### [0075]

インタフェース回路部40は、トランザクション層において、データリンク層 パケットから、トランザクション層パケットを取り出し、さらに、データと取り 出して、図4(f)に示すように同期化用バッファ50に出力する。

#### [0076]

内部回路部60は、同期信号S1の立ち上がりに同期して、同期化用バッファ 50からデータを取得し、取得したデータをプロセッサ13,14、主記憶装置 15に出力する。

#### [0077]

I/Oブリッジ18からメモリブリッジ16, 26にデータを送信する場合、I/Oブリッジ18とメモリブリッジ16との間と、I/Oブリッジ18とメモリブリッジ26との間で、リンクL1の配線長に差異がほぼなければ、図5(b), (c) に示すように、メモリブリッジ16, 26は、ほぼ同時にデータを受信する。

### [0078]

しかし、I/Oブリッジ28とメモリブリッジ26との間のリンクL1が、I/Oブリッジ18とメモリブリッジ16との間のリンクL1よりも長いと、図5(d),(e)に示すように、メモリブリッジ16,26がデータを受信するタイミングに差異が生じる。

### [0079]

但し、差異が生じても、同じ同期信号S1の周期内であれば、演算システム11,21は、クロック信号CLKに同期して同じ処理を実行する。

もし、メモリブリッジ26が、同期信号S1の1周期目と2周期目とでデータを受信するようになるのであれば、I/Oブリッジ18は、1パケットにおけるデータの長さを短くするように、BIOSを用いてコンフィギュレーションレジスタ19が格納しているデータを変更する。

# [0080]

次に、図6(a)、(b)に示すように、メモリブリッジ16のインタフェース回路部40が、同期信号S1の第2クロックサイクルにおいて、受信したパケットの通信エラーを検出するものとする。

#### [0081]

この場合、通信エラー処理部46は、図6(c)、(e)に示すように、第3 クロックサイクルにおいて、データリンク層パケット(DLLP)をその一部に含んで いたとしても、すべてのパケットをキャンセル扱いとする。

#### [0082]

そして、通信エラー処理部46は、第3クロックサイクル以降のパケットもキャンセルする。通信エラー処理部46は、第2クロックサイクルでキャンセルしたパケットが再送されるまで、すべてのパケットの受信をキャンセルする。

# [0083]

通信エラー処理部46は、通信エラーが検出されると、データリンク層(RX)44において、管理されているパケットのシーケンス番号をエラー発生前の番号に設定し直す。

### [0084]

また、通信エラーが検出されると、通信エラー処理部46は、図6(d)に示すように、通信エラー信号S2をロー(L)レベルとしてアサート、即ち、有効とする。同期信号S1の第4クロックサイクルになると、パケットは受信されないため、通信エラー処理部46を、ディアサートする。

### [0085]

通信エラー処理部46は、データの送信元であるI/Oブリッジ18に、データの再送を要求する。I/Oブリッジ18は、メモリブリッジ16から再送要求を受信した場合、再送要求のあったパケットを再送する。また、メモリブリッジ16からのACK信号が返送されずに、所定期間が経過した場合にも、送信が確認されていないパケットの再送信を行う。

#### [0086]

続いて、図7(b)に示すように、メモリブリッジ16が、同期信号S1の第6クロックサイクルにおいて、再送要求に応答してシーケンス番号2のパケットを受信し、通信エラーがなければ、インタフェース回路部40は、図6(c)~(e)に示すように、キャンセルされた第3クロックサイクル以降のパケットを、そのまま、受信する。

#### [0087]

次に、図8(a)~(c)に示すように、メモリブリッジ16が受信したデータに通信エラーは検出されなくても、メモリブリッジ26が通信エラーを検出すると、メモリブリッジ26は、図8(d)に示すように、メモリブリッジ16にローレベルの通信エラー信号S2を出力する。

#### [0088]

メモリブリッジ26は、同期信号S1の第3クロックサイクルにおいて、通信エラー信号S2がアサートされると、通信エラー処理部46は、図8(e)に示

すように、同期信号S1の第3クロックサイクルにおいて保持しているシーケンス番号2のパケットをキャンセルする。

### [0089]

通信エラー処理部46は、同期信号S1の第4クロックサイクル以降、トランザクション層47へのパケットの引き渡しを停止する。

そして、通信エラー処理部46は、データリンク層(RX)44において、管理する次回受信予定パケットのシーケンス番号を、パケットキャンセル前の値に再設定させる。

### [0090]

図9(a),(b)に示すように、メモリブリッジ16が、通信エラーを有するパケットに続いて、データリンク層パケットのみで構成されるパケットを受信した場合、通信エラー処理部46は、図6(c),(e)に示すように、まず、通信エラーを有するパケットをキャンセルする。

### [0091]

通信エラー処理部46は、通信エラーを有するパケットをキャンセルすると、 図9(d)に示すように、通信エラー信号S2をアサートして、シーケンス2以降のパケット列の再送信を要求する。しかし、通信エラー処理部46は、通信エラーを有するパケットをキャンセルしても、図6(c),(e)に示すように、 同期信号S1の第3クロックサイクルにおいて受信されたデータリンク層パケットをキャンセルしない。これは、データリンク層パケットには、シーケンス番号 がないため、シーケンス番号エラーが発生しないためである。

# [0092]

エラー処理部46は、データリンク層パケットをキャンセルしなくても、再送されたパケットのシーケンス番号から、順序を特定することができ、メモリブリッジ16は、問題なく再送信されたパケットを受信することができる。

### [0093]

以上説明したように、本実施の形態によれば、メモリブリッジ16のインタフェース回路部40が通信エラーを検出した場合、通信エラー処理部46が受信したパケットをキャンセルする。そして、通信エラー処理部46は、アサートした

通信エラー信号S2をメモリブリッジ26に出力し、キャンセルしたパケットの 再送をパケット送信元に要求するようにした。

### [0094]

従って、通信エラーが生じた場合でも、メモリブリッジ16,26の通信エラー処理部が連携してパケット送信元に、パケットの再送信をするようになるため、受信データの同期ずれを回避することができる。そして、演算システム11,21は、同一のデータ処理を同期して行うことができる。

### [0095]

また、I/Oブリッジ18が、リンクL1の配線長に差異が生じても、影響を受けないように、送信するパケットのパケット長、データ数に制限が設けるようにした。

### [0096]

従って、フォールトトレラントコンピュータシステムを構成するための回路基 盤設計および筐体設計が容易になる。

### [0097]

尚、本発明を実施するにあたっては、種々の形態が考えられ、上記実施の形態 に限られるものではない。

例えば、上記実施の形態では、メモリブリッジ16,26、I/Oブリッジ18,28に、インタフェース回路部を備えるようにした。しかし、図10に示すように、演算システム11,21において、メモリブリッジ16,26とは別に、それぞれ、送受信ブリッジ71,72を備え、また、I/Oシステム12,22とは別に、それぞれ、送受信ブリッジ81,82を備えることができる。

#### [0098]

この場合、送受信ブリッジ 71, 72, 81, 82は、それぞれ、通信エラー処理部を備える。送受信ブリッジ 71, 72は、それぞれ、メモリブリッジ 16, 26に接続され、送受信ブリッジ 81, 82は、それぞれ、I/Oブリッジ 18, 28に接続される。

#### [0099]

そして、送受信ブリッジ71,72と、送受信ブリッジ81,82とは、互い

にロックステップ方式に従って同期化されてデータの送受信を行う。尚、送受信ブリッジ71,72は、既存のメモリブリッジ16,26とは、1セットの通信リンクで接続される。接続は、既存のメモリブリッジのサポートする高速シリアルリンクによって行われる。この場合、メモリブリッジ16と送受信ブリッジ71、メモリブリッジ26と送受信ブリッジ72との間のリンクの配線長は、受信タイミングの差異による通信エラーの発生を避けるため、できるだけ、短くされる。

### [0100]

このように構成されることにより、既存のシステムチップセットコンポーネントをそのまま利用して、フォールトトレラントコンピュータシステムを構成することができる。

### [0101]

本実施の形態では、コンピュータシステムに2つのサブシステム1,2を備え、また、サブシステム1,2に、それぞれ、2つのプロセッサ13,14,23,24を備えて、コンピュータシステムを二重化冗長構成とした。しかし、コンピュータシステムの構成は、これに限られるものではなく、三重化冗長構成、あるいはそれ以上の冗長構成とすることができる。

# [0102]

また、本実施の形態では、高速シリアルリンクとしてPCI-Expressを例として 説明した。しかし、リンクとしては、これに限られるものではなく、InfiniBand 、HyperTransport等の他の高速シリアルリンクを用いることもできる。

#### [0103]

また、本実施の形態では、メモリブリッジ16,26と、I/Oブリッジ18,28との間で送受信するデータをシリアルデータとして説明したが、パラレルデータであっても、本実施の形態を適用することができる。

#### [0104]

#### 【発明の効果】

以上説明したように、本発明によれば、通信エラーが生じた場合でも同一のデータ処理を同期して行うことができる。

### 【図面の簡単な説明】

### 【図1】

本発明の実施の形態に係るコンピュータシステムの構成を示すブロック図である。

#### 図2

送受信されるパケットデータの構成を示す説明図である。

### 【図3】

図1に示すメモリブリッジの詳細な構成を示すブロック図である。

# 【図4】

図1に示すメモリブリッジの動作を示すタイミングチャートである。

### [図5]

図1に示すメモリブリッジの動作を示すタイミングチャートである。

### 【図6】

図1に示すメモリブリッジの動作を示すタイミングチャートである。

#### 【図7】

図1に示すメモリブリッジの動作を示すタイミングチャートである。

#### 【図8】

図1に示すメモリブリッジの動作を示すタイミングチャートである。

#### 【図9】

図1に示すメモリブリッジの動作を示すタイミングチャートである。

### 【図10】

本発明の実施の形態に係るコンピュータシステムの応用例を示すブロック図である。

# 【符号の説明】

- 1, 2 サブシステム
- 13、14, 23, 24 プロセッサ
- 16, 26 メモリブリッジ
- 18, 28 I/Oブリッジ
- 46 通信エラー処理部

3 1 分周器

【書類名】 図面

# 【図1】





【図3】















【図10】



【書類名】 要約書

【要約】

【課題】 通信エラーが生じた場合でも同一のデータ処理を同期して行えるようにする。

【解決手段】 クロスリンク接続されたメモリブリッジ16,26と、I/Oブリッジ18,28とには、PCI-Expressインタフェースに従ってデータの送受信を行うためのインタフェース回路部が、それぞれ、備えられる。また、各インタフェース回路部には、通信エラー処理部が備えられる。メモリブリッジ16の通信エラー処理部は、I/Oブリッジ18から受信したデータにエラーが発生すると、受信したデータをキャンセルしてメモリブリッジ26に通信エラー信号を出力する。メモリブリッジ26は、この通信エラー信号が供給されてデータの受信を停止する。そして、メモリブリッジ16の通信エラー処理部は、I/Oブリッジ18にデータの再送信を要求する。

【選択図】 図1

特願2003-115621

出願人履歴情報

識別番号

[000004237]

1. 変更年月日

1990年 8月29日

[変更理由]

新規登録

住 所

東京都港区芝五丁目7番1号

氏 名

日本電気株式会社